Beyond Identifier Matching: An Empirical Characterization of Failure Modes in Biomedical Knowledge Graph Integration
本文通过实证表明,仅依赖标识符匹配进行生物医学知识图谱整合是不够的,并揭示出尽管跨本体和基于嵌入的方法能够提高覆盖率,但它们会系统性地引入诸如过度合并和语义坍塌等具有临床重要性的失效模式,从而掩盖下游应用中的关键区别。
153 篇论文
健康信息学正以前所未有的速度重塑现代医疗,它不再仅仅是电子病历的数字化,而是利用数据科学挖掘海量健康信息,以优化诊疗决策、提升公共卫生响应效率。这一领域架起了临床医学与计算技术之间的桥梁,让原本沉睡的数据转化为挽救生命的洞察。
在 Gist.Science,我们专注于从 medRxiv 预印本服务器中实时追踪该领域的最新研究。我们处理每一份新发布的论文,不仅提供详尽的技术解读,更将其核心发现转化为通俗易懂的中文摘要,确保无论是专业人士还是普通公众都能轻松理解这些前沿突破。
以下为您呈现健康信息学领域的最新论文列表,带您第一时间探索数据驱动医疗的未来。
本文通过实证表明,仅依赖标识符匹配进行生物医学知识图谱整合是不够的,并揭示出尽管跨本体和基于嵌入的方法能够提高覆盖率,但它们会系统性地引入诸如过度合并和语义坍塌等具有临床重要性的失效模式,从而掩盖下游应用中的关键区别。
本文介绍了一种探索性人工智能推荐系统,该系统利用可解释人工智能生成关于特征选择、非线性项及交互作用的数据驱动推荐,从而显著提升如 Cox 比例风险模型等高维临床模型的预测性能与可解释性。
本研究评估了环境人工智能文档系统在混合语言临床场景中的表现,发现尽管整体转录错误率较低且语言切换通常能被可靠检测,但在中英文语码转换方面仍存在显著挑战,包括高错误异常值以及在切换点频繁出现的删除现象。
本研究评估了前沿大语言模型在将多模态临床表型文档转化为可执行电子健康记录算法方面的表现,发现尽管它们能有效解读结构化文本,但在仅含图表的输入下性能显著下降,最终确定文档质量而非模型能力是主要瓶颈。
本系统综述与荟萃分析涵盖30项研究,表明机器学习与深度学习算法在早期阿尔茨海默病检测中具有高诊断准确性,但该领域仍需标准化评估方案与外部验证,以减轻过拟合风险并确保其临床适用性。
本研究揭示,多语言消费者健康人工智能存在一种关键的不平衡现象:其临床实质内容与安全表现因语言不同而显著差异——在非英语语境中往往静默失效——却在所有语言中保持一致且富有同理心的语调。
本文提出了一种流行病学启发的图神经网络(EIGNN)框架,该框架将机制性流行病学模型与数据驱动的接触网络相结合,以准确预测和解释医院内感染动态,同时通过透明度确保临床信任。
对1995年至2025年间1,430项美国食品药品监督管理局(FDA)授权进行的横断面分析显示,尽管人工智能/机器学习赋能的医疗器械批准数量呈指数级激增,但它们仍高度集中于影像丰富的诊断专科(如放射学),而在病理学、产科和行为健康等其他主要临床领域则存在显著的代表性缺口。
本研究开发并验证了一个基于极端梯度提升的可解释机器学习框架,用于准确分类2015年至2025年肯尼亚47个县的疟疾传播状态,证明整合流行病学与环境数据可有效支持针对性监测与资源分配。
本文介绍了 MISP-Bench,这是一个大规模因子基准测试,用于评估开放权重语言模型在临床和教育情境中对用户提供的错误先验信息的响应,结果表明:结合答案与推理的攻击造成的损害呈次加性,与任意干扰项相比,针对性干扰项显著增加了奉承倾向,而特定的安全防御策略(如来源独立性和显式覆盖)能有效降低各类模型对错误信息的易感性。